home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Meeting Pearls 4
/
Meeting Pearls Vol. IV (1996)(GTI - Schatztruhe)[!].iso
/
Contrib
/
Patricia
/
Patricia.dok
< prev
next >
Wrap
Text File
|
1995-09-26
|
6KB
|
133 lines
Patricia
---===================================================---
Practical Algorithm To Retrieve Information Coded In Alphanumeric
Übersicht
---------
Dies ist eine Implementierung einer erweiterten Version von D.R. Morrison's
in [1] beschriebenem Patricia. Einige der Features sind:
- Suche nach einem beliebigen Text in AmigaGuide und ASCII Dateien.
- Das Ergebnis ist ein AmigaGuide Dokument mit Links zu allen Dateien, bzw.
AmigaGuide-Nodes, in denen der Suchtext gefunden wurde, und Angaben, wie oft
der Text gefunden wurde.
- Die gefundenen Textstellen können farblich hervorgehoben werden.
- Die Suche basiert auf einer vorausberechneten Datenbank, daher ist die
Suche sehr schnell.
- Mit einer geeigneten Datenbank werden alle Vorkommen (auch als Wortbe-
standteil) jedes Wortes gefunden. Bei der Datenbankerzeugung kann die
Menge der Worte, die in die Datenbank aufgenommen werden, jedoch
eingeschränkt werden, um die Datenbankgröße zu verringern.
PSearch Dokumentation:
----------------------
PSearch kann von Workbench und Shell gestartet werden und unterstützt alle
OS >= 1.2. Shell-Argumente ab OS 2.04 sind:
DataBases/A/M,Search/K,P=FilePattern/K,NOH=NoHighlight/S,Profile/S,
BaseDir/K,TempDir/K,GuideViewer/K,TextViewer/K,PHighPath/K
DataBases - eine Liste von Patricia Datenbanken, in denen gesucht wird
Search - Text(e), nach dem/denen gesucht wird (s.a. unten)
FilePattern - nur Dateien, die zu diesem Pattern passen, werden durchsucht
NoHighlight - gefundene Textpassagen nicht hervorheben
Profile - einige Statistiken beim Suchen anzeigen
BaseDir - Pfad der durchsuchten Dateien;
normalerweise in der Datenbank selbst auch gespeichert
TempDir - wird zum Zwischenspeichern und für hervorgehobene Texte
verwendet, Default: "T:"
Sollte der Speicher nicht reichen, entweder auf Platte legen
oder mit "NoHighlight" suchen.
GuideViewer - AmigaGuide Anzeiger, Default: "AmigaGuide []"
Achtung: Um die richtige Node in einem hervorgehobenen
Dokument anzuzeigen, wird immer
"AmigaGuide xxx Document yyy" benutzt!
TextViewer - wird verwendet um ASCII Texte anzuzeigen, Default: "More []"
PHighPath - der Pfad von PSearch
Kann weggelassen werden, wenn PHighlight im Suchpfad oder im
aktuellen Verzeichnis beim Starten von PSearch steht.
Unter OS <= 1.3 wird Unix Argument-Parsing verwendet und einige Features
stehen nicht zur Verfügung: GUI, Profiling und Pattern Matching.
PSearch -s Search -n -b BaseDir -t TempDir -g GuideViewer
-v TextViewer -h PHighPath - DataBase1 DataBase2 ...
^^^
Bitte den Bindestrich beachten!
-sbtgvh - wie oben
-n - NoHighlight
PHighlight wird von PSearch verwendet, um Textabschnitte hervorzuheben. Es
sollte nicht per Hand aufgerufen werden. Es wird wird von PSearch gefunden,
wenn es im Suchpfad oder im beim Starten von PSearch aktuellen Verzeichnis
steht.
Suchtext
--------
PSearch kann nach einer beliebig großen Anzahl von Texten suchen, die durch
" | " getrennt werden. Die Leerzeichen um das "|" sind nötig, da es sonst zu
dem benachbarten Wort dazugezählt wird. Ein einzelner Text kann aus mehreren
Worten bestehen. Der Text wird nur dann gefunden, wenn die Worte im Text und
in den Dateien durch genau diesselbe Anzahl Leerzeichen getrennt werden, d.h.
"Meeting Pearls" (ein Leerzeichen) unterscheidet sich von "Meeting Pearls"
(zwei Leerzeichen). Return, Leerzeichen und Tabulatoren werden nicht
unterschieden.
Ein Text wird unter Umständen nicht gefunden, wenn er ein Wort enthält, das
zu kurz ist oder im Text zu oft vorkommt. Im Ergebnis wird darauf
hingewiesen, es gibt aber auch ein "Workaround": Angenommen, es soll nach
"Dummmy-Name ist Dummmy-Adjektiv." gesucht werden.
"ist" wird wahrscheinlich an dieser Stelle in der Datenbank nicht vorkommen.
Daher würde diese Stelle nicht gefunden werden. Statt dessen kann nach
"Dummy-Name Dummy-Adjektiv" (drei Leerzeichen statt "ist") gesucht
werden. Dies wird mehr Auftreten finden, aber es findet auch "Dummy-Name war
Dummy-Adjektiv".
Einschränkungen
---------------
Wenn die Anzahl der in der Datenbank gespeicherten Worte absichtlich
eingeschränkt wurde oder ein Fehler auftrat, dann wird das Ergebnis nicht
vollständig sein. Im Ergebnis-AmigaGuide Dokument wird darauf mit einer
genauen Erklärung hingewiesen. Allen ungenauen Zahlen wird ein ">="
vorangestellt.
Wenn ein Wort in einem AmigaGuide Dokument zum Teil in einem anderen
Textstil geschrieben wird, dann kann nur nach dem einen oder dem anderen
Teil gesucht werden, nicht nach dem ganzen Wort. Außerdem wird bei einer
Suche nach einem Text aus mehreren Worten diese Sequence nicht gefunden,
wenn zwischen den Worten in der Datei Formatanweisungen stehen, weil PSearch
die Formatanweisungen nicht von Leerzeichen unterscheiden kann.
Distribution
------------
Diese Distribution enthält nur die zur Textsuche notwendigen Programme
(PSearch und PHighlight). Sie können frei vertrieben werden. Das Programm
PCreateDB, mit dem eine Datenbank erstellt werden kann, ist nicht enthalten
und darf auch nicht ohne Erlaubnis des Autors weitergegeben werden. Alle
Programme und Textdateien sind © 1995 Patrick Ohly.
Wenn Sie Patricia für eigene Datenbanken verwenden oder vertreiben wollen,
dann fragen Sie bitte den Autor um Erlaubnis und Konditionen. Angela Schmidt
hat hiermit die Erlaubnis, Datenbanken für die Meeting Pearls III zu
erstellen und PSearch, PHighlight und diese Anleitung auf dieser CD zu
vertreiben.
Autor
-----
Patrick Ohly
Weechstr. 1, WG E0/1
76131 Karlsruhe
Germany
Tel.: +49 721 615662
eMail: patrick.ohly@stud.uni-karlsruhe.de
IRC: Irish@AmigaGer
Quellen
-------
[1] R. Sedgewick, Algorithmen; Addison-Wesley 1992
[2] D. E. Knuth, The Art of Computer Programming,
Volume 3: Sorting and Searching, Addison-Wesley 1975